直方图 - 连续数据的可视化表示
定义:直方图是一种用于显示连续数据分布的图形,其中矩形的面积表示频率。
特点:
公式:\[ \text{频率密度} = \frac{\text{频率}}{\text{组距}} \]
用途:当组距不同时,使用频率密度可以正确比较不同组的频率。
题目:某班级学生身高数据如下,绘制直方图。
| 身高区间(cm) | 140-150 | 150-160 | 160-170 | 170-180 | 180-190 |
|---|---|---|---|---|---|
| 频率 | 2 | 8 | 15 | 10 | 5 |
步骤1:计算频率密度
• 140-150组:频率密度 = \(\frac{2}{10} = 0.2\)
• 150-160组:频率密度 = \(\frac{8}{10} = 0.8\)
• 160-170组:频率密度 = \(\frac{15}{10} = 1.5\)
• 170-180组:频率密度 = \(\frac{10}{10} = 1.0\)
• 180-190组:频率密度 = \(\frac{5}{10} = 0.5\)
步骤2:绘制直方图
• 横轴:身高(cm)
• 纵轴:频率密度
• 每个矩形的面积 = 频率密度 × 组距 = 频率
题目:某工厂产品重量数据如下,组距不同,绘制直方图。
| 重量区间(kg) | 0-5 | 5-10 | 10-20 | 20-30 |
|---|---|---|---|---|
| 频率 | 8 | 12 | 20 | 15 |
计算频率密度:
• 0-5组:频率密度 = \(\frac{8}{5} = 1.6\)
• 5-10组:频率密度 = \(\frac{12}{5} = 2.4\)
• 10-20组:频率密度 = \(\frac{20}{10} = 2.0\)
• 20-30组:频率密度 = \(\frac{15}{10} = 1.5\)
注意:由于组距不同,必须使用频率密度来绘制直方图,确保矩形面积代表频率。
某学校学生体重数据如下:
| 体重区间(kg) | 40-50 | 50-60 | 60-70 | 70-80 | 80-90 |
|---|---|---|---|---|---|
| 频率 | 5 | 12 | 18 | 8 | 3 |
绘制直方图,并计算每组的频率密度。
答题区域:
某公司员工年龄数据如下:
| 年龄区间(岁) | 20-25 | 25-30 | 30-40 | 40-50 |
|---|---|---|---|---|
| 频率 | 6 | 10 | 16 | 12 |
绘制直方图,注意不同组距的处理。
答题区域:
某直方图显示学生考试成绩分布,频率密度如下:
| 分数区间 | 0-20 | 20-40 | 40-60 | 60-80 | 80-100 |
|---|---|---|---|---|---|
| 频率密度 | 0.1 | 0.3 | 0.5 | 0.4 | 0.2 |
计算每组的频率,并说明哪个分数段的学生最多。
答题区域:
解答过程:
计算频率密度:
• 40-50组:频率密度 = \(\frac{5}{10} = 0.5\)
• 50-60组:频率密度 = \(\frac{12}{10} = 1.2\)
• 60-70组:频率密度 = \(\frac{18}{10} = 1.8\)
• 70-80组:频率密度 = \(\frac{8}{10} = 0.8\)
• 80-90组:频率密度 = \(\frac{3}{10} = 0.3\)
绘制直方图:
• 横轴:体重(kg)
• 纵轴:频率密度
• 每个矩形高度对应频率密度,宽度为10kg
解答过程:
计算频率密度:
• 20-25组:频率密度 = \(\frac{6}{5} = 1.2\)
• 25-30组:频率密度 = \(\frac{10}{5} = 2.0\)
• 30-40组:频率密度 = \(\frac{16}{10} = 1.6\)
• 40-50组:频率密度 = \(\frac{12}{10} = 1.2\)
绘制直方图:
• 注意组距不同,必须使用频率密度
• 25-30岁组频率密度最高(2.0)
解答过程:
计算频率:
• 0-20组:频率 = 0.1 × 20 = 2
• 20-40组:频率 = 0.3 × 20 = 6
• 40-60组:频率 = 0.5 × 20 = 10
• 60-80组:频率 = 0.4 × 20 = 8
• 80-100组:频率 = 0.2 × 20 = 4
分析:
40-60分数段的学生最多(10人),频率密度也最高(0.5)。